Corpus: nno-no_web_2017_100K

Other corpora

6.2.2 Size of largest domains

Largest domains

Source # of sentences
/ 33439
old.dagogtid.no/ 3707
www.aasentunet.no/ 3497
www.midtsiden.no/ 1333
www.uniforum.uio.no/ 1175
www.daria.no/ 1104
historier.no/ 1032
www.heimskringla.no/ 878
midtsiden.host-it.no/ 865
www.storfjordnytt.no/ 808
# of distinct sources
3766
868 msec needed at 2021-09-17 17:29